AI资讯新闻榜单内容搜索-LLM

告别多奖励跷跷板：Flow-OPD将多教师OPD带入图像生成

今年以来，在线策略蒸馏 OPD（On-Policy Distillation）已经逐渐成为大厂 LLM 后训练中的重要组件，例如 DeepSeek-V4，GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力，相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报

7319 点击 2026-05-26 10:07

LLM助力突破尘封60年数学猜想！北大王立威团队大幅刷新斯坦纳比下界

近期，LLM 已经在 IMO 上取得了很好的成绩，在一些研究级数学上（如短程证明、组合构造）也有所进展。但如果真正让 LLM 去处理提出数十年的数学猜想，结果会是如何？

来自主题: AI技术研报

5729 点击 2026-05-18 15:29

虾马之后又火一个！OpenHuman用20分钟了解你的一切，存成卡帕西式知识库

虾在前，马当道，居然还有新物种能在Agent赛道突出重围。OpenHuman连续霸榜GitHub Trending第一，狂揽9k+ Star，一天就涨千星。和虾马不一样，Human不用你花心思养，还能反过来主动了解你。

来自主题: AI资讯

9340 点击 2026-05-17 11:33

从图像到视频的任意分割：X2SAM让MLLM 真正看懂像素级时空世界

为了解决这一问题，来自中山大学和美团的研究团队提出了 X2SAM，一个统一的图像与视频分割多模态大模型框架。它希望让模型不仅能「看懂」图像和视频，还能进一步「指出」目标在每个像素上的准确位置。

来自主题: AI技术研报

7956 点击 2026-05-16 10:50

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8469 点击 2026-05-13 15:01

AI教父Yann LeCun公开diss：谁再说像素重建没问题，我跟谁急！带10亿美元离开Meta只为证明你们走错了！

“LLM 就是一条死路。”

来自主题: AI资讯

10106 点击 2026-05-12 14:32

ICML 2026 | 大模型内部也会长出「情绪树」，规模越大越懂人心

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6480 点击 2026-05-12 14:31

动手搭建 AI 硬件设计平台！本地 LLM 一句话生成完整 Arduino 项目（接线图 + BOM + 代码 + 步骤）

大家好，最近有人刚刚为电子产品开发了一个 Claude Code 工具。它叫做 Blueprint。输入你想要构建的内容，它就会为你的 Arduino 或树莓派项目生成接线图、物料清单和分步组装指南。能不能自己搭建一个呢？

来自主题: AI资讯

9104 点击 2026-05-10 12:50

Anthropic最新论文撬开大模型黑箱：隐藏动机发现率提升 4 倍以上

刚刚，Anthropic 发布论文《Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations》，试图用一套自然语言自动编码器（Natural Language Autoencoders，下文简称 NLA），撬开这个黑箱。

来自主题: AI技术研报

9345 点击 2026-05-08 14:33

号称1200万token上下文的模型来了，数据亮眼但疑点重重

当地时间 5 月 5 日，迈阿密一家名为 Subquadratic 的公司走出隐身模式。CTO Alexander Whedon 在 X 上把首款模型 SubQ 称作“a major breakthrough in LLM intelligence”（LLM 智能领域的重大突破），

来自主题: AI资讯

7462 点击 2026-05-07 12:02